O Fim do 'Almoço Grátis'
Durante décadas, desenvolvedores aproveitaram o "Teto Sequencial" — uma era em que Escalabilidade de Dennard garantia de que cada nova geração de chips trazia velocidades mais rápidas de relógio. Mas atingimos a Parede de Potência. O desempenho já não é uma função da frequência; é uma função da concorrência. Para avançar, devemos empregar Pensamento Computacional para pontuar a lacuna entre os métodos numéricos e os modelos modernos de execução paralela.
A Tensão entre Precisão e Desempenho
Mover um problema de domínio (como Dinâmica Molecular) de um host multicore para dispositivos CUDA é mais do que uma mudança de sintaxe; é uma mudança na Decomposição de Problemas. Quando paralelizamos, muitas vezes mudamos a ordem das operações. Como a aritmética de ponto flutuante é não associativa, enfrentamos um compromisso: Precisão de ponto flutuante versus precisão. Um resultado paralelo pode ser matematicamente válido, mas numericamente divergente do seu ancestral sequencial.